[レポート] The Future of AI – AI 研究のトップが語る AI の今と未来 #SalesforceTour
本ブログは、2019年9月25,26日にザ・プリンスパークタワー東京/東京プリンスホテルにて開催されたSalesforce World Tour Tokyo 2019のキーノートセッション、
「The future of AI - AI研究のトップが語るAIの今と未来」
のレポートです。
概要
Salesforce Research のチーフサイエンティストである、リチャード・ソーチャー博士が来日します。Salesforce に組み込まれた AI 、 Einstein に使われている最先端のテクノロジーを提供している世界トップクラスの AI の研究者から、未来の AI の姿や、今求められている AI のあり方、そして日本語に対する AI についてご紹介します。
セッション動画
https://www.salesforce.com/jp/video/6958130/
レポート
- AIは様々な場面で活用されており、コンシューマの世界が変わってきている
- すべての業界が様変わりする。自動運転や農業におけるAI。Eコマースにおいても。AIはすでに世の中をより良くしている
- 自然言語処理、画像認識、レコメンデーション。AIは、巨額の研究費のある一部の大企業だけのものではない
- Salesforceは中小企業を含めたすべての企業に、AIを提供していきたいと考えている
- SalesforceのAIリサーチは、基礎研究/応用研究2つの様相に分かれている
基礎研究
- 「要約化」という技術。多くの情報を要約化することを求められている。
- 「昨晩は夜遅かったが翌日の会議は朝早くてもいいのか?」といった一般的なものの見方もAIができるようになってきた
- decaNLPモデルが台頭している。自然言語処理をQ&Aという形で展開できるモデル
画像認識
- 保険業界では既に使われている。写真を撮ってアプリケーションへ取り込むと、事故車の損害額や保証金を瞬時に判断してくれる
- Object Detectionで物体検出し、ボートレースの中でスポンサー企業ロゴがどれだけ登場するかを確認する。マーケティングキャンペーンに効果があったかを判断するのが効率よくできる
音声認識
- 既に一般的な音声認識技術や製品は広まりつつある。なぜSalesforceが音声認識なのか?
- 各業界・社内の専門用語を認識してもらいたいというニーズ
- ユーザーは機密データを一般的な音声認識のデータとして利用してほしくない
- Salesforceは信頼されている環境で、ユーザーのプロセスを向上させる目的だけに使われる
自然言語処理(NLP)
- 自然言語処理には取り組むべきたくさんの分野がある
言語モデル
- 言語モデルとは? -> 文章を入力すると、次の言葉を予測するというシンプルなもの
- AI側は言語や一般常識、世界についてたくさんのインプットが必要
- CTRLを利用した文章予測生成
- 入力テキストと制御コードを組み合わせることで適切な文章を予測する
- 例えば、「Wikipedia」や「Running Title」という制御コードを指定する。すると、Wikipediaの記事のような文章やランニングに関する文章といった、それぞれに適したものを予測して生成できる
- 制御コードを指定すれば、質問を投げかけて回答してもらうことや翻訳をしてもらうことも可能
- 存在しないリンクURLを制御コードとして指定すると、URLに含まれている情報から判断して文章を生成できる
- 「2007/2014/2018に米国大統領が英国首相と会った」という記事を、それぞれの年の情報(当時誰が大統領・首相だったか)から記事を生成する
- 例えば言語モデルを利用して、チャットボットを構築できる。言語モデルが適切な文章や返答を生成する
- 今後2年、この言語モデルはゲームチェンジャーになりうる
応用研究
- AI研究/エンジニアリング/製品のチームで協力して進めている
- AIのオープンソース化は進んでいるが、セキュリティや負荷分散、GDPRの対応などの観点からエンジニアリングが特に大変
- 文字認識(OCR)
- 写真から名刺情報を抽出する
- 表形式の写真を読み取ってスプレッドシートに入力する
- 問い合わせをAIで要約
- 長い入力データから内容を抽象化して要約版を作成する
- CRMのための音声技術
- Salesforceのすべてのアプリケーションを音声対応していきたい
- 自動音声認識 + 自然言語理解 + テキストの音声化
- 各ブランドに合った、異なる音声を提供したい
- Einstein Voice
- Salesforceのボイスアシスタント。会議が終わった後に話しかけると、AIが会議を文章化してくれる
- Einstein Voiceを使うことで、一人ひとりがアシスタントを持つことができる
Salesforce Researchは製品を強化する
- AIプラットフォームを活用してもらうことで、CRMをより強化できる
- Einstein Visionを使えば、物体認識を様々なシーンで活用できる。売り場の物を数えたり商品の同定など
- Einstein Languageでカスタマーサポートを強化する
AIによる倫理観について
- AIのインパクトや影響力を考える必要がある
- マクロ、ミクロ的な視点どちらからも考えることが必要
- マクロ的な視点:仕事が自動化されていく。ガバナンスや納税に対する影響
- ミクロ的な視点:人々がAIによってどのような影響を受けるのか。AIのデータセットの源はどこなのか、AIの判断にバイアスはかかっていないかを確認すること
- Salesforceが考える理想のAI
最後に
- その他、Eistein.aiに情報を公開しているのチェックしてみてください
QA
Q. Einsteinをユーザー向けのサービスに利用したい。業態に合わせるためどれくらいのデータセットやスケジュールが必要か?
- 最も大きな決定要素はトレーニングデータの数。ユーザー側にそれほどデータが無くてもよい結果が出るように準備している。例えばEメールキャンペーンやメールのトリアージなど。
- 画像認識は別。例えば事故車の損害額を判断するようなユースケースであれば1000個ぐらいのデータは必要。
- EinsteinのNLPは16億のパラメーターで学習されておりパワフル。将来的に100個程度のトレーニングデータで済むようになるかもしれない。
Q. 要約化などは日本語環境ではいつ使えるようになるか?
- アプリケーションにもよるが、インテントモデル、トリアージ、チャットボット用のインテントは既に多言語化されており日本語でも利用可能。但し、100個程度の少ないトレーニングデータで利用できるようになるのは来年から。現状では多くのトレーニングデータが必要。
Q. 例えば契約の詰めや意思決定などをAI同士で行えないか?
- AIはもう少しインプットを増やして人間の意思決定に関わることが必要。
- 完全な自律型AIで契約の意思決定を行うのは適切ではないのでは。より早く正確な人間の意思決定をサポートするためにAIを活用したほうがよい
Q. これからの5〜10年のタームでAIでカバーするのが難しい領域は?
- 専門職であるレントゲン技師の例。技師は8年、10年の学習をして業務を行う
- AIは瞬時に判断ができるが、技師は順番待ちなどで数十分かかってしまうかもしれない
- 特定の分野においてはAIがカバーできるが、現時点ではすべてをAIでできるわけではない。例えば症例が少ないものはトレーニングデータが少なく、様々な文献を読んでいる技師の判断には勝てない
- トレーニングデータが少ないものは、あえてAIを使う必要がないというケースもある
- その他、人と人の関わりが大事な仕事などは、必ずしもAIに置き換えられないと思う
おわりに
SalesforceのEinsteinサービスで利用されているAI技術の研究の現在や、製品にどのように活用されているかについてのセッションでした。
個人的にはAIによる倫理観の話題が興味深く、AIのプラットフォームがカジュアルに利用できるような時代において、活用する側もどのような目的でAIを利用するのか、バイアスがかかっていない正しいデータセットを利用しているのか、といったことを、倫理的な側面からも意識する必要があることを再認識できました。
自分自身はSalesforceのEinsteinサービスはまだ深く活用していませんが、これからより多くのAIサービスが登場することで益々CRMの効率化やプロセスの向上が進むのではないかと思います。